Clean Code - Chapter 6 对象与数据结构

2016-12-04 00:45

作者:给立乐*
出处:http://spencer-dev.com/2016/12/04/Clean Code - Chapter 6 对象与数据结构
声明:本文采用以下协议进行授权: 自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。

对象和数据结构

将变量设置为私有(private)有一个理由:我们不想其他人依赖这些变量。我们还想在心血来潮时能自由修改其类型或实现。那么,为什么还是有那么多程序员给对象自动添加赋值器和取值器,将私有变量公之于众、如同它们根本就是公共变量一般呢?

数据抽象

1
2
3
4
5
// 6-1
public class Point {
public double x;
public double y;
}
1
2
3
4
5
6
7
8
9
// 6-2
public interface Point {
double getX();
double getY();
void setCartesian(double x, double y);
double getR();
double getTheta();
void setPolar(double r, double theta);
}

这两段代码,都代表了笛卡尔平面上的点。不过,其中一段暴露了其实现,而另一个则完全隐藏了实现。

代码 6-2 的漂亮之处在于,你不知道该实现会是在矩形坐标系中还是在极坐标系中。可能两个都不是!然而,该借口还是明白无误地呈现了一种数据结构。

不过它呈现的还不只是一个数据结构。那些方法固定了一套存储策略。你可以单独取某个坐标,但必须通过一次原子操作设定所有坐标。

而代码 6-1 中,则非常清楚地是在矩形坐标系中实现的,并要求我们单个操作那些坐标。这就暴露了实现。实际上,即便变量都是私有的,而且我们也通过变量取值器和赋值器使用变量,其实现仍然暴露了。

隐藏实现并非只是在变量上放一个函数层那么简单。隐藏实现关乎抽象!类并不简单地用取值器和赋值器将其变量推向外间,而是暴露抽象借口,以便用户无需了解数据的实现就能操作数据本体。

看看代码 6-3 和 6-4。前者使用具象手段与机动车的燃料层通信,而后者采用百分比抽象。你能确定前者里面都是些变量的存取器,而却无法得知后者中的数据形态。

1
2
3
4
5
// 6-3
public interface Vehicle {
double getFuelTankCapacityInGallons();
double getGallonsOfGasoline();
}
1
2
3
4
// 6-4
public interface Vehicle {
double getPercentFuelRemaining();
}

以上两段代码以后者为佳。我们不愿暴露数据细节,更愿意以抽象形态表述数据。这并不只是用接口和/或赋值器、取值器就万事大吉。要以最好的方式呈现某个对象包含的数据,需要作严肃的思考。傻乐着乱加取值器和赋值器,是最坏的选择。

数据、对象的反对称性

下面两个例子展示了对象与数据结构之间的差异。对象把数据隐藏于抽象之后,曝露操作数据的函数。数据结构曝露其数据,没有提供有意义的函数。回过头再读一遍。留意这两种定义的本质。它们是对立的。这种差异貌似微小,但却有深远的含义。

Geometry 类操作三个形状类。形状类都是简单的数据结构,没有任何行为。所有行为都在 Geometry 类中。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
// 6-5 过程式形状代码
public class Square {
public Point topLeft;
public double side;
}
public class Rectangle {
public Point topLeft;
public double height;
public double width;
}
public class Circle {
public Point center;
public double radius;
}
public class Geometry {
public final double PI = 3.141592653589793;
public double area(Object shape) throws NoSuchShapeException {
if (shape instanceof Square) {
Square s = (Square)shape;
return s.side * s.side;
}
else if (shape instanceof Rectangle) {
Rectangle r = (Rectangle)shape;
return r.height * r.width;
}
else if (shape instanceof Circle) {
Circle c = (Circle)shape;
return PI * c.radius * c.radius;
}
throw new NoSuchShapeException();
}
}

面向对象程序员可能会对此嗤之以鼻,抱怨说这是过程式代码——他们大概是对的,不过这种嘲笑并不完全正确。想想看,如果给 Geometry 类添加一个 primeter() 函数会怎样。那些形状类根本不会因此而受影响!另一方面,如果添加一个新形状,就得修改 Geometry 中的所有函数来处理它。再读一遍代码。注意,这两种情形也是直接对立的。

现在来看看代码 6-6 中的面向对象方案。这里,area() 方法是多态的。不需要有 Geomerty 类。所以,如果添加一个新的形状,现有的函数一个也不会受到影响,而当添加新函数时所有的形状都得做修改。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
// 6-6 多态式形状
public class square implements Shape {
private Point topLeft;
private double side;
private double area() {
return side * side;
}
}
public class Rectangle implements Shape {
private Point topLeft;
private double height;
private double wdith;
private double area() {
return height * width;
}
}
public class Circle implements Shape {
private Point center;
private double radius;
public final double PI = 3.141592653589793;
public double area() {
return PI * radius * radius;
}
}

我们再次看到这两种定义的本质;它们是截然对立的。这说明了对象与数据结构之间的二分原理:

过程式代码(使用数据结构的代码)便于在不改动既有数据结构的前提下添加新函数。面向对象代码便于在不改既有函数的前提下添加新的类。

反过来讲也说得通:

过程式代码难以添加新数据结构,因为必须修改所有函数。面向对象代码难以添加新的函数,因为必须修改所有类。

所以,对于面向对象较难的事,对于过程式代码却较容易,反之亦然!

在任何一个复杂系统中,都会有添加新数据类型而不是新函数的时候。这时,对象和面向对象就比较合适。另一方面,也会有想要添加新函数而不是数据类型的时候。在这种情况下,过程式代码和数据结构更合适。

得墨忒耳律

著名的得墨忒耳律(The Law of Demeter)认为,模块不应了解它所操作对象的内部情形。如上节所见,对象隐藏数据,曝露操作。这意味着对象不应通过存取器曝露其内部结构,因为这样更像是曝露而非隐藏其内部结构。

这里介绍一下 得墨忒耳律

  1. 每个单元对于其他的单元只能拥有有限的知识:只是与当前单元紧密联系的单元;
  2. 每个单元只能和它的朋友交谈:不能和陌生单元交谈;
  3. 只和自己直接的朋友交谈。

举个例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
// 6-7
public class A {
private B b = new B();
public void methodA(C c) {
methodB(); // 该对象自己拥有的方法,可调用
b.print(); // 该对象直接拥有的对象的方法,可调用
c.print(); // 传入该方法的参数的方法,可调用
D d = new D();
d.print(); // 该方法创建的对象的方法,可调用
E e = b.getE();
e.print(); // 该对象依赖对象的实现的模块,不可调用!
}
private void methodB() {
}
}

回归正题。

下列代码就违反了得墨忒耳律(除了违反其他规则之外)。

因为它调用了 getOptions() 返回值的 getScratchDir() 函数,又调用了 getScratchDir() 返回值的 getAbsolutePath() 方法。

1
2
// 6-8
final String outputDir = ctxt.getOptions().getScratchDir().getAbsolutePath();

火车失事

这类代码常被称作火车失事,因为它看起来就像是一列火车。这类连串的调用通常被认为是肮脏的风格,应该避免。最好做类似如下的切分:

1
2
3
4
// 6-9
Options opts = ctxt.getOptions();
File scratchDir = opts.getScratchDir();
final String outputDir = scratchDir.getAbsolutePath();

上列代码是否违反了得墨忒耳律呢?当然了,模块知道 ctxt 对象包含多个选项,每个选项中都有一个临时目录,而每个临时目录都有一个绝对路径。对于一个函数,这些知识真够丰富的。调用函数懂得如何在一大堆不同对象间浏览。

这些代码是否违反得墨忒耳律,取决于 ctxt、Options 和 ScratchDir 是对象还是数据结构。如果是对象,则它们的内部结构应当隐藏而不曝露,而有关其内部细节的知识就明显违反了得墨忒耳律。如果 ctxt、Options 和 ScratchDir 只是数据结构,没有任何行为,则它们自然会曝露其内部结构,得墨忒耳律也就不适用了。

属性访问器函数的使用把问题搞复杂了。如果像下面这样写代码,我们大概就不会提及对得墨忒耳律的违反。

1
2
// 6-10
final String outputDir = ctxt.options.scratchDir.absolutePath;

如果数据结构简单地拥有公共变量,没有函数,而对象则拥有私有变量和公共函数,这个问题就不那么混淆。然而,有些框架和标准甚至要求最简单的数据结构都要有访问器和改值器。

混杂

这种混淆有时会不幸导致混合结构,一半是对象,一半是数据结构。这种结构拥有执行操作的函数,也有公共变量或公共访问器及改值器。无论出于怎样的初衷,公共访问器及改值器都把私有变量公开化,诱导外部函数以过程式程序使用数据结构的方式使用这些变量。

此类混杂增加了添加新函数的难度,也增加了添加新数据结构的难度,两面不讨好。应避免创造这种结构。它们的出现,展示了一种乱七八糟的设计,其作者不确定——或者更糟糕,完全无视——他们是否需要函数或类型的保护。

隐藏结构

假使 ctxt、Options 和 ScratchDir 是拥有真实行为的对象又怎样呢?由于对象应隐藏其内部结构,我们就不该能够看到内部结构。这样一来,如何才能取得临时目录的绝对路径呢?

1
2
// 6-11
ctxt.getAbsolutePathOfScratchDirectoryOption();

或者

1
2
// 6-12
ctxt.getScratchDirectoryOption().getAbsolutePath();

第一种方案可能导致 ctxt 对象中方法的曝露。

第二种方案是在假设 getScratchDirectoryOption() 返回一个数据结构而非对象。

两种方案感觉都不好。

如果 ctxt 是个对象,就应该要求它做点什么,不该要求它给出内部情形。那我们为何还要得到临时目录的绝对路径呢?我们要它做什么?来看看这段代码:

1
2
3
4
// 6-13
String outFile = outputDir + "/" + className.replace('.','/') + ".class";
FileOutputStream fout = new FileOutputStream(outFile);
BufferedOutputStream bos = new BufferedOutputStream(fout);

这种不同层级细节的混杂有点麻烦。句点、斜杠、文件扩展名和 File 对象不该如此随便地混杂到一起。不过,撇开这些毛病,我们发现,取得临时目录绝对路径的初衷是为了创建指定名称的临时文件。

所以,直接让 ctxt 对象来做这事如何?

1
2
// 6-14
BufferedOutputStream bos = ctxt.createScratchFileStream(classFileName);

这下看起来像是个对象做的事了!ctxt 隐藏了其内部结构,防止当前函数因浏览它不该知道的对象而违反得墨忒耳律。

数据传送对象

最为精练的数据结构,是一个只有公共变量、没有函数的类。这种数据结构有时被称为数据传送对象,或 DTO(Data Transfer Objects)。DTO 是非常有用的结构,尤其是在与数据库通信、或解析套接字传递的消息之类场景中。在应用程序代码里一系列将原始数据转换为数据库的翻译过程中,它们往往是排头兵。

更常见的是如代码清单 6-15 所示的 Bean 结构。Bean 结构拥有由赋值器和取值器操作的私有变量。对 Bean 结构的半封装会让某些 OO 纯化论者感觉舒服些,不过通常没有其他好处。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
// 6-15
public class Address {
private String street;
private String streetExtra;
private String city;
private String state;
private String zip;
public Address(String street, String streetExtra, String city, String state, String zip) {
this.street = street;
this.streetExtra = streetExtra;
this.city = city;
this.state = state;
this.zip = zip;
}
public String getStreet() {
return street;
}
public String getStreetExtra() {
return streetExtra;
}
public String getCity() {
return city;
}
public String getState() {
return state;
}
public String getZip() {
return zip;
}
}

Active Record

Active Record 是一种特殊的 DTO 形式。他们是拥有公共(或 bean 式访问的)变量的数据结构,但通常也会拥有类似 save 和 find 这样的可浏览方法。Active Record 一般是对数据库表或其他数据源的直接翻译。

我们却经常发现开发者往这类数据结构中塞进业务规则方法,把这类数据结构当成对象来用。这是不智的行为,因为它导致了数据结构和对象的混杂体。

当然,解决方案就是把 Active Record 当做数据结构,并创建包含业务规则、隐藏内部数据(可能就是 Active Record 的实体)的独立对象。

小结

对象曝露行为,隐藏数据。便于添加新对象类型而无需修改既有行为,同时也难以在既有对象中添加新行为。数据结构曝露数据,没有明显的行为。便于向既有数据结构添加新行为,同时也难以向既有函数添加新数据结构。

在任何系统中,我们有时会希望能够灵活地添加新数据类型,所以更喜欢在这部分使用对象。另外一些时候,我们希望能灵活地添加新行为,这时我们更喜欢使用数据类型和过程。优秀的软件开发者不带成见地了解这种情形,并依据手边工作的性质选择其中一种手段。


Comments: